1
확률에서 가능도로: 추론의 과학
MATH003Lesson 6
00:00
통계적 추론은 알려진 매개변수(확률)에 기반해 결과를 예측하는 것에서, 관찰된 데이터와 가장 일치하는 매개변수를 결정하는 것으로 전환됩니다(가능도). 확률 밀도 함수 $f(x|\theta)$는 고정된 $\theta$에 대해 데이터 $x$의 분포를 설명하지만, 가능도 함수 $L(\theta|x)$는 관찰된 데이터를 고정하고 매개변수 $\theta$를 변화시켜 다양한 가설에 대한 상대적인 지지 정도를 측정합니다.

역전 원리

가능도 함수는 종종 결합 밀도 형태로 표현됩니다. 고정된 분산을 가진 정규분포의 경우, 가능도는 다음과 같이 정의됩니다:

$L ( \theta | x_1, \dots, x_n ) = \exp\left( -\frac{n}{2\sigma_0^2} (\bar{x} - \theta)^2 \right)$

여기서는 표본 평균 $\bar{x}$가 주어졌을 때, 서로 다른 $\theta$ 값의 "타당성"을 평가합니다. 이 타당성의 최고점(피크)을 찾기 위해 우리는 정의 6.2.2: 로그 가능도 $l(\theta | s) = \ln L(\theta | s)$를 사용합니다. 이 변환은 독립적인 관측값들의 곱을 합으로 바꾸어, 복잡한 모델의 최대화를 계산적으로 가능하게 합니다.

실제 사례: 키 조사 (예제 6.3.5)

데이터

표본 크기가 $n=30$이고, 계산된 표준편차가 $s=2.379$인 키 데이터를 고려합니다. 위치-척도 정규모형을 사용하여 진짜 평균 $\theta$를 추정하려고 합니다.

추론 및 정밀도

표준오차는 $s/\sqrt{30} = 0.43434$로 계산됩니다. 이 값은 우리의 가능도 피크의 "예리함"을 측정합니다. 더 작은 표준오차는 더 좁고 날카로운 피크를 의미하며, $\theta$에 대한 추론의 정밀도가 높음을 나타냅니다.

차원과 제약 조건

복잡한 상황, 예를 들어 예제 6.1.5 (다항모형)에서는 논리적 의존성을 고려해야 합니다. 언급된 바와 같이, "어떤 두 개의 $\theta_i$ 값이 알려지면 나머지 매개변수의 값도 즉시 알 수 있다"는 점을 인식해야 합니다. 이 제약조건은 매개변수 공간 $\Omega$를 올바르게 정의하는 데 필수적입니다.

점근적 기초

가능도에서 추론으로 넘어가는 다리는 중심극한정리에 의존합니다. $n \to \infty$일 때, 우리의 추정량의 분포는 수렴합니다. 특히, 예제 6.5.4 베르누이 모형:

$Z = \frac{\sqrt{n}(\bar{X} - \theta)}{\sqrt{\bar{X}(1 - \bar{X})}} \xrightarrow{D} N(0, 1)$

이는 충분히 큰 표본을 갖는 경우, z구간과 p값을 사용해 불확실성을 정량화할 수 있게 해줍니다.

🎯 핵심 원리
분포에 의존하지 않는 통계적 추론 방법은 표본 분포에 대한 최소한의 가정만 필요하며, 가족 $\{P_{\theta} : \theta \in \Omega\}$이 매우 클 경우 강건합니다. 반면, 파라메트릭 가능도 방법은 로그 가능도의 곡률에 의존하며, 피셔 정보 $nI(\theta)$가 스코어 함수의 분산을 결정합니다.